ในขณะที่เคอร์เนลแบบ 1D มองข้อมูลเป็นลำดับเชิงเส้น การรับรู้โครงสร้างแบบ 2D เปลี่ยนแนวทางไปสู่การประมวลผลข้อมูลในรูปแบบที่มีโครงสร้าง บล็อก (Tiles)ฮาร์ดแวร์กราฟิกสมัยใหม่ช่วยเพิ่มประสิทธิภาพโดยรวมองค์ประกอบต่างๆ เป็นตาราง 2 มิติ เพื่อเพิ่มประสิทธิภาพในการเข้าถึงข้อมูลที่อยู่ใกล้กัน และใช้คอร์เฉพาะสำหรับการประมวลผลเทนเซอร์ได้อย่างเต็มศักยภาพ
1. ข้ามการประมวลผลแบบองค์ประกอบเดียว
ในแบบ 1 มิติ แต่ละเธรดจะคำนวณค่าสเกลาร์ ในขณะที่เคอร์เนลแบบ 2 มิติของทริตอน โปรแกรมจะดำเนินการกับบล็อกทั้งหมดพร้อมกัน ซึ่งขยายแนวคิดการบวกเวกเตอร์พื้นฐานให้กลายเป็นการแปลงเมทริกซ์ที่ซับซ้อน เช่น GEMM
2. การเข้าถึงข้อมูลตามพื้นที่ (Spatial Locality)
การเข้าใจว่าองค์ประกอบที่อยู่ใกล้กัน (แนวนอนและแนวตั้ง) จะถูกดึงเข้ามาในแคชอย่างไร เป็นก้าวสำคัญที่ทำให้เคอร์เนลที่เรียนรู้กลายเป็นเคอร์เนลที่พร้อมใช้งานจริง ซึ่งช่วยให้แม้จะมีหน่วยความจำที่ถูกสลับตำแหน่งหรือมีการเติมเต็ม ก็ยังสามารถเข้าถึงข้อมูลได้อย่างมีประสิทธิภาพ โดยไม่เสียแบนด์วิดธ์
3. ทางสู่การใช้งานจริง
การควบคุมโครงสร้างแบบ 2 มิติ ช่วยให้สามารถแบ่งข้อมูลออกเป็นส่วนต่าง ๆ ได้อย่างมีประสิทธิภาพบน หน่วยประมวลผลแบบสตรีมมิ่ง (SMs) ได้อย่างมีประสิทธิภาพ ตัวอย่างเช่น การคัดลอกเมทริกซ์ที่รับรู้ขนาดความกว้าง/ความสูง สามารถโหลดบล็อก 16×16 เข้าสู่หน่วยความจำแบบเร็วภายในชิปได้ โดยคงความเป็นจริงของ "ระยะห่าง" (stride) ของเทนเซอร์ไว้